Spatial, R, code et communauté : retour sur les rencontres R

Geotribu1

Delphine Montagne

2023-11-10

Introduction

Pastille hexagonale de R aux couleurs jaune coquille d’oeuf et bleu azur d’Avignon

En juin dernier, Avignon a accueilli les Rencontres R, le plus grand événement français dédié au célèbre logiciel libre de statistiques. Il y avait un invité spécial : le spatial. Ce qui tombe bien, car si je ne suis plus débutante sur ce logiciel, j’ai encore des marches de progression à passer.

C’est de ce point de vue que je propose ce retour sur trois jours de présentations et de discussions.


Découvrir le spatial et R : l’atelier pratique

Le premier jour des rencontres commence officiellement l’après-midi, le temps que tout le monde arrive sur le site. L’organisation (je reviendrai sur son magnifique travail plus bas) a donc banalisé la matinée avec des tutoriels. Si le machine learning était proposé, si Quarto était également au menu…

Adorable image d’un hérisson frileux tricotant HTML, Word, PDF, LATEX, sites internet etc… Comme le fait Quarto – Illustration par Alison Hill and Allison Horst, pour RStudio, tirée de la présentation de Christophe Dervieux.

La session Quarto avait l’air très chouette.

… j’étais bien évidemment inscrite à l’atelier d’analyse spatiale avec R proposé par Kim Antunez (INSEE) et Etienne Côme (Université Gustave Eiffel). Au programme, carte statistiques, cartes interactives et analyse spatiale avec les deux. D’abord on parle des cartes statiques, avec la révolution de “sf” et sa déclinaison spatiale “sfg”, soit simple feature geometry, qui a l’avantage d’être composé d’autre chose que de 0 et 1, ce qui le rend compréhensible par un être humain.

Tableau de données avec des exemples de simple feature

Le package mapsf a pris le pas sur d’autres, comme cartography. J’y ai notamment appris l’existence du geoparquet pour traiter les gros volumes de données spatiales… Et que différentes versions de R peuvent bloquer dans des exercices sans que l’on n’est aucun message d’erreur (sinon ce n’est pas drôle). Je n’ai pas eu le temps de tout explorer pour la partie carte interactive, les deux heures étant très denses pour tout le programme prévu. C’est un atelier parfait pour les géographes, mais les personnes extérieures à cette thématique sont restées bloquées sur les tenants et aboutissants de termes comme les zones tampons ou polygones de Voronoï.


Aurélie Vache : combattre le sentiment d’imposture

Le choix d’une conférence d’ouverture est un exercice d’équilibriste. Il faut offrir un contenu riche, tout en étant accessible et percutant. Avec ce cahier des charges en tête, le choix d’Aurélie Vache (OVHcloud) était plus que brillant.

Après avoir rappelé que c’est un problème de comparaison, que l’on trouve donc beaucoup dans le milieu de la tech’ et particulièrement dans l’informatique, que les femmes sont assez touchées (mais pas uniquement), elle a donné de bonnes astuces :

  1. Être dans une communauté ;
  2. Rédiger des articles sur son blog perso, puis sur d’autres (Géotribu par exemple), dans des journaux, faire des conférences et aller dans des écoles ;
  3. Ne pas copier les autres, avoir confiance en ses idées et son style ;
  4. Tooter ce que l’on a appris aujourd’hui, pour les autres comme pour soi ;
  5. Faire du pair programming ;
  6. Face aux haters, s’appuyer sur ses personnes proches (cercle amical, famille, collègues de confiance) ;
  7. Demander des retours et non pas de la validation.

Au passage, elle a égratigné avec un mordant libérateur l’obligation d’avoir le bon cursus, voire la passion des recrutements avec obligatoirement LE diplôme de LA bonne école.

Elle a rappelé le validisme ambiant, dont nos milieux ne sont pas épargnés, avec le talent de quelqu’un capable de présenter avec humour des horreurs. Bonne nouvelle, pour la voir changer de la boue en or, sa présentation a été filmée et je ne peux que vous la conseiller.


Les paillettes de Lise Vaudor (épisode 1)

logo glitteR Le package GlitteR explore le web sémantique, comprenez des données qui sont elles-mêmes reliées à d’autres données, ce qui donne par exemple Wikidata. J’ai appris que l’on y accède grâce à des points d’accès, les endpoint. Lise Vaudor (CNRS) rappelle fort justement que l’inconvénient des graphes de connaissance, c’est que l’on ne peut pas avoir une vision d’ensemble comme avec un tableau… D’où l’importance de connaître son terrain ou de partir d’un terrain connu afin de pouvoir couper les branches inutiles du graphe. Et GLitteR dans tout cela ? Il permet d’accéder aux données de Wikidata avec R, sans avoir à passer par le SPARQL. Une grosse avancée pour les personnes pas du tout à l’aise avec ce langage. Il est vrai que tout le monde n’a pas encore eu de wikimédien ou wikimédienne en résidence (patience).


Shiny selon Enedis

Chez Enedis, l’application Shiny est traitée de manière très originale : comme un prototype de futures potentielles applications. Par exemple, peut-on ajouter une borne de recharge électrique sans faire de surcharge sur le réseau ? Avec Shiny, on peut modéliser l’ajout d’une borne et voir ce qui se passe.

Copie d’écran d’une carte modélisant une nouvelle borne et ses conséquences sur l’approvisionnement – Les données sont factices

Ce qui m’a intéressée, c’est leur méthode : Shiny est pensé pour avoir des retours et des améliorations continues durant 3 ans.

Ça marche ? Enedis développe une application dédiée hors Shiny.

Ça ne marche pas ? Abandon de ce test, sans avoir eu à avancer trop de moyens coûteux.


L’INSEE passe à R

logo INSEE C’est LA grande annonce du colloque. L’institution publique de la statistique française passe sur LE logiciel libre des statistiques. Un changement pareil ne se fait pas naturellement dans une institution aussi ancienne. Alors comment a-t-elle procédé ?

  1. C’est un choix institutionnel, et donc impulsé en tant que tel ;
  2. Montrer ce que l’on peut faire de plus avec R par rapport à SAS ;
  3. Beaucoup de formations et de supports partagés en interne ;
  4. Mobilisation de Quarto et de RMarkdown.

Comment impulser de bonnes pratiques de codage, comme la documentation ? L’INSEE en a listé plusieurs ici, dont :


Les RLadies françaises

logo RLadies Depuis 2016, il existe un groupe des Rladies en France qui regroupe plus de 500 personnes. Beaucoup de leurs événements parisiens sont aussi disponibles en ligne, comme les rediffusions de leurs réunions.


Publier ses réalisations sur R

Logo de Rzine

Faire du code R, ui. Faire de magnifique réalisations, ui à nouveau. Les documenter (un motif récurrent de ces conférences, vous l’aurez noté), c’est encore mieux.

Face à la dispersion des ressources sur R en sciences humaines et sociales, Hugues Pecout (Géographie-cités) nous a fait la présentation de Rzine. Ce site internet centralise la documentation existante, mais aussi et surtout, il permet de publier des fiches techniques inédites. Avec un DOI bien sûr ! Idéal pour valoriser son travail, notamment dans les environnements de recherche.


L’informatique partage ses bonnes pratiques pour R

C’est une présentation si dense et riche qu’il vaut mieux renvoyer à la vidéo pour en picorer tous les (nombreux) éléments intéressants relatifs à son niveau.
Mais pour une non-informaticienne comme moi, en voici quelques uns :


Data visualisation et R

Yan Holtz (Datadog) est revenu durant cette plénière sur la présentation des données avec R et sur les outils utilisés en fonction du public. Par exemple, si des collègues ont du mal sur R, leur proposer datawrapper.

Il a rappelé que ggplot2 a été en 2007 une révolution en faisant passer R d’un outil exploratoire à un outil explicatif qui permet de faire de la dataviz avec R. Une révolution qui a infusé jusqu’à Python et JavaScript. Il a également mentionné Rtutor pour faire du Shiny aidé par chatGPT.


L’IGN en mode happi

Logo de happign

Paul CARTERON a présenté LE package qui permet d’accéder à toutes ses données, Lidar compris : :star: happign :star:. C’est un des éléments qui me fait aimer R et me pousse à m’y former : la facilité d’accès aux données avec le logiciel.


Un package spatial : Timothée Giraud et mapsf

Logo de mapsf On l’a indiqué, ces journées R portaient spécialement sur le spatial. Timothée Giraud (UAR RIATE) est donc venu présenter le travail autour de ce package phare.

Il a commencé par un historique rappelant la généalogie des différents packages qui intègrent la géographie et qui petit à petit a permis l’émergence de :star: mapsf :star:.

On l’a dit plus haut, mapsf s’appuie sur le standard simple feature (aussi mobilisé par PostGIS) pour importer, exporter et faire les géotraitements de données géographiques. Il est également revenu sur la mise à la retraite d’un package, exemplaire selon lui de ce qu’il faut bien faire dans la communauté.

Il est revenu sur les possibilités de package, avec des exemples avignonnais évidemment.

J’ai appris que la communauté R avait une passion pour les palettes de couleur. Avec par exemple paletteer et l’appli shiny cols4all qui permet de tester le rendu pour les personnes daltoniennes… Du moins si les fantastiques palettes ColorBrewer, déjà incluses dans mapsf, ne suffisent pas.


Les paillettes de Lise Vaudor (épisode 2)

C’est au tour de la présentation de Lise Vaudor qui nous propose un retour sur son parcours et ses réalisations.

Ingénieure agronome, elle a été recrutée au CNRS après sa thèse en écologie/statistiques, notamment grâce à ses compétences en R. Son travail au quotidien s’articule autour du soutien à la recherche et elle propose beaucoup de formation continue… Notamment auprès d’un public doctorant tRaumatisé.

C’est de cette expérience de terrain qu’est né son blog Ratique et la création de contenus visant à démocratiser R. Un contenu qu’elle a voulu illustré, avec ses propres dessins (tant qu’à faire), avec des couleurs pastels, des GlitteR paillettes et des blagues. Elle propose des antisèche illustrées et soignées (devinez les couleurs ? pastels, bravo) et des métaphores visuelles accessibles qui piochent dans la dataviz. Du contenu créé sur son temps de travail (et valorisé comme tel par le CNRS).

Grimoire étrange et poussiéreux dont s’échappent des paillettes - Crédits : Lise Vaudor – Qui n’a pas envie de faire des paillettes de la géomaRgie ?

Comment parler à tout le monde quelle que soit la discipline ? Lise Vaudor transporte son public dans le monde de la magie grâce à ses “grimoires”. Mais elle travaille moins sur ce contenu ces temps-ci.

Car elle est revenue sur son parcours personnel, notamment sa double maternité qui a quelque peu chamboulé sa vie. Elle a donc rejoint les RLadies, “seulement maintenant” car elle n’en ressentait pas le besoin. Elle indique ne pas avoir eu à souffrir de sexisme dans la communauté R.

Les raisons ?

Pour elle, c’est l’ouverture de la communauté. Une ouverture qui se retrouve aussi dans l’équipe du programme de ces journées, qui a voulu mettre à égalité les différents genres, mélanger secteur privé/public, universitaire et non-universitaire etc.

C’est une communauté capable de valoriser ses paillettes, ses dessins, ses couleurs pastels et tout le contenu de ses formations, par exemple par cette invitation à une intervention dans une plénière. Une intervention au même niveau que celle présentant un gros package, comme celui de Timothée Giraud.


Quelles bonnes idées à piquer à l’organisation ?

Tour de cou en carton, aux couleurs de R avec une invite de commande indiquant le nom et prénom de la personne Ce n’est bien entendu pas visible dans ce compte-rendu : les Rencontres R étaient mûrement réfléchies en termes d’inclusion et d’environnement. C’est la première fois que je viens à un événement professionnel avec un code de conduite. Cette charte est à signer lors de l’inscription, rappelée en plénière, à chaque moment collectif et nous avons eu une présentation des personnes à qui s’adresser en cas de problème. C’était bienvenu.

L’engagement était aussi écologique : les goodies venaient des environs. La bière, brassée spécialement pour l’occasion, était locale, tout comme le jus de fruit. Nous avions de la verrerie aux couleurs des rencontres, produite elle aussi tout proche, et que l’on utilisait donc pour les pauses cafés. Le tour de cou, avec un clin d’oeil malin à R, rappelait toutes les informatiques pratiques, dont le programme numérique, le programme papier étant limité aux rares personnes sans téléphone. Enfin, pour garder un ultime souvenir de ces journées, le tour de cou ensemencé peut se planter afin d’obtenir de délicieuses plantes aromatiques.


En savoir plus

Plusieurs sessions étaient en parallèle : ce billet présente à peine la moitié des interventions. Il y en a bien d’autres, que vous pouvez aller découvrir ici :

Merci à l’organisation pour ces journées !

Autrice

Delphine Montagne

Cartographe et géomaticienne, je participe à plusieurs projets libres, comme OpenStreetMap et Wikipédia. J’aime autant les cartes que la biodiversité, passions que je partage toujours avec enthousiasme.

Licence 

Vous êtes autorisé(e) à :

Retour sur les Rencontres R d’Avignon” publié par Delphine Montagne sur Geotribu sous CC BY-NC-SA - Source : https://geotribu.fr/articles/2023/2023-11-10_retour-conference-journees-R-2023/